Détection de séquences atypiques basée sur un modèle de Markov d'ordre variable
نویسندگان
چکیده
Résumé. Récemment, le nombre et le volume des bases de données séquentielles biologiques ont augmenté de manière considérable. Dans ce contexte, l’identification des anomalies est essentielle. La plupart des approches pour les extraire se fondent sur une base d’apprentissage ne contenant pas d’outlier. Or, dans de très nombreuses applications, les experts ne disposent pas d’une telle base. De plus, les méthodes existantes demeurent exigeantes en mémoire, ce qui les rend souvent impossibles à utiliser. Nous présentons dans cet article une nouvelle approche, basée sur un modèle de Markov d’ordre variable et sur une mesure de similarité entre objets séquentiels. Nous ajoutons aux méthodes existantes un critère d’élagage pour contrôler la taille de l’espace de recherche et sa qualité, ainsi qu’une inégalité de concentration précise pour la mesure de similarité, conduisant à une meilleure détection des outliers. Nous démontrons expérimentalement la validité de notre approche.
منابع مشابه
Un modèle neuro markovien profond pour l'extraction de séquences dans des documents manuscrits
RÉSUMÉ. Dans cet article, nous proposons un système d’extraction de mots clés dans des documents manuscrits. Notre approche est basée sur la reconnaissance des lignes de texte à l’aide d’un modèle HMM capable de rejeter les mots n’appartenant pas à un lexique prédéfini. Afin d’être plus discriminant, nous avons remplacé les mélanges de gaussiennes des HMM par un réseau de neurones profond pour ...
متن کاملDescription intégrée de processus cellulaires spatiotemporels basée sur un modèle géométrique de transformation
RÉSUMÉ. L’observation de la dynamique spatiotemporelle d’objets biologiques déformables génère sous forme de séquences d’images une quantité énorme d’informations généralement sousexploitées. Nous montrons dans cet article comment une analyse de ces séquences, basée sur un modèle paramétrique de transformation, permet de caractériser de façon originale les déformations de tels objets à partir d...
متن کاملApprentissage de représentation pour la détection de source dans les réseaux sociaux
RÉSUMÉ. Récemment, divers travaux se sont interessés à la détection de source de diffusion dans les réseaux sociaux : il s’agit de déterminer l’utilisateur à partir duquel une information propagée a initiallement été émise. Dans cet article, nous proposons une nouvelle méthode pour la détection de source de diffusion, basée sur des techniques d’apprentissage de représentation. Plutôt que de s’a...
متن کاملExtraction d'objets vidéo : une approche combinant les contours actifs et le flot optique
Résumé. Dans cet article, nous présentons une méthode mixte de segmentation d'objets visuels dans une séquence d'images d'une vidéo combinant à la fois une segmentation basée régions et l'estimation de mouvement par flot optique. L'approche développée est basé sur une minimisation d'une fonctionnelle d'énergie (E) qui fait intervenir les probabilités d'appartenance (densité) avec une gaussienne...
متن کاملInterpolation par assimilation variationnelle de séquences multimodales d'images satellitaires de l'océan
RÉSUMÉ. Cet article étudie l’estimation conjointe de données manquantes et de champs de déplacements dans des séquences multimodales d’observations satellitaires géophysiques. La complexité de la tâche est liée au taux élevé de données manquantes (entre 20 % et 90 %) pour des observations journalières de haute résolution et la reconstruction de structures fines en accord avec la dynamique sous-...
متن کامل